AI资讯新闻榜单内容搜索-LLaMA

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLaMA
奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了

奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了

奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了

刚刚,奥特曼接连抛出重磅消息:GPT-5不仅将免费开放,还将整合多项尖端技术。o3和o4-mini即将在几周内亮相,还有一个神秘的开源推理模型要来。然而,另一边Meta的Llama 4却因性能瓶颈屡次延期,AI竞赛的格局愈发扑朔迷离。

来自主题: AI资讯
9000 点击    2025-04-05 15:13
Llama 4发布在即,Meta AI负责人突然官宣离职

Llama 4发布在即,Meta AI负责人突然官宣离职

Llama 4发布在即,Meta AI负责人突然官宣离职

Meta AI研究副总裁Pineau亲自发帖声称将于5月30日离职,她主导了Llama开源系列及PyTorch项目。此举正逢扎克伯格重金投入AI及LlamaCon AI大会前夕,引发业内对Meta战略调整和未来新作的诸多猜测。

来自主题: AI资讯
9886 点击    2025-04-05 01:09
模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

最近,AI 公司 Databricks 推出了一种新的调优方法 TAO,只需要输入数据,无需标注数据即可完成。更令人惊喜的是,TAO 在性能上甚至超过了基于标注数据的监督微调。

来自主题: AI技术研报
8244 点击    2025-03-30 14:33
速递|Meta被曝与云巨头密签Llama分成协议,开源模型的寄生式盈利

速递|Meta被曝与云巨头密签Llama分成协议,开源模型的寄生式盈利

速递|Meta被曝与云巨头密签Llama分成协议,开源模型的寄生式盈利

在 2024 年七月的一篇博客文章中,Meta CEO 马克·扎克伯格表示,“出售访问权限”给 Meta 公开可用的 Llama AI 模型“不是 Meta 的商业模式。”

来自主题: AI资讯
10412 点击    2025-03-24 10:52
速递|Meta豪赌AI,即将发布全能模型Llama 4

速递|Meta豪赌AI,即将发布全能模型Llama 4

速递|Meta豪赌AI,即将发布全能模型Llama 4

马克·扎克伯格今年正在提升 Meta 人工智能的语音功能,准备从这项快速发展技术中创收。

来自主题: AI资讯
10138 点击    2025-03-10 14:37
为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

虽然 Qwen「天生」就会检查自己的答案并修正错误。但找到原理之后,我们也能让 Llama 学会自我改进。

来自主题: AI技术研报
7723 点击    2025-03-06 09:37
语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

近年来,大语言模型(LLMs)取得了突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前,普遍的观点认为其成功依赖于自回归模型的「next token prediction」范式。

来自主题: AI技术研报
8154 点击    2025-02-17 14:37
超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

2024年11月,艾伦人工智能研究所(Ai2)推出了Tülu 3 8B和70B,在性能上超越了同等参数的Llama 3.1 Instruct版本,并在长达82页的论文中公布其训练细节,训练数据、代码、测试基准一应俱全。

来自主题: AI技术研报
6830 点击    2025-02-05 16:54
杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

刚刚,大模型竞技场榜单上再添一款国产模型——来自阿里,Qwen2.5-Max,超越了DeepSeek-V3,以总分1332的成绩位列总榜第七。同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。

来自主题: AI资讯
7625 点击    2025-02-05 11:19
曝DeepSeek让Llama4未发布已落后!小扎坐不住了:2025预算4000亿起步,年底AI算力将达130万卡

曝DeepSeek让Llama4未发布已落后!小扎坐不住了:2025预算4000亿起步,年底AI算力将达130万卡

曝DeepSeek让Llama4未发布已落后!小扎坐不住了:2025预算4000亿起步,年底AI算力将达130万卡

Meta这次真的坐不住了,计划在AI上继续加码!匿名员工爆料,黑马DeepSeek的出现,让Llama 4还未发布就已经落后,Meta慌了。

来自主题: AI资讯
7666 点击    2025-01-26 00:01